خلاصه سازی خودکار متن انگلیسی

thesis
abstract

خلاصه سازی یک فرآیند تصمیم گیری است که در آن برای هر جمله چندین معیار در نظر گرفته می شود و ارزش هر جمله در معیارها سنجیده می شود. سپس با سبک و سنگین کردن نتایج ارزیابی ها جملات برای حضور در خلاصه انتخاب می شوند. در این پایان نامه معماری جدیدی برای سیستم های خلاصه ساز ارائه شده است. در این معماری یک لایه ی تصمیم گیرنده به عنوان آخرین لایه در سیستم، مسئولیت امتیازدهی به جملات بر اساس امتیاز هر جمله در ویژگی های مجزا را بر عهده دارد. در واقع این لایه، عمل سبک و سنگین کردن جملات را انجام می دهد. وجود این لایه ی تصمیم گیر نیاز به داده های آموزشی برای محاسبه ی وزن های هر کدام از ویژگی های مورد بررسی را مرتفع می سازد. گرچه می توان دقت این لایه را بر اساس داده های آموزشی افزایش داد و یا اینکه با آموزش آن، سیستم های خلاصه ساز شخصی ساخت. ماتریس تصمیم به عنوان جز اصلی در تصمیم گیری چندمعیاره مورد استفاده قرار می گیرد. در ساخت ماتریس تصمیم هر جمله به عنوان یک سطر و هر یک از ویژگی های مورد بررسی نیز به عنوان یک ستون در نظر گرفته می شوند. در این پایان نامه روش آماری-زبان شناسی جدیدی نیز برای خلاصه سازی خودکار متن ارائه شده است. در این روش بر اساس ماتریس ارتباط، موضوعات مختلف در متن کشف و جملات متن در هر یک از این موضوعات کلاس بندی می شوند. سپس به روشی که در قسمت مربوطه آورده شده است امتیاز هر کدام از جملات و موضوعات تعیین می شوند. با توجه به امتیازها و روند به روز کردن امتیازها در چند گام خلاصه تولید می شود. در این پایان نامه تولید خلاصه های از نوع گزینشی تک سندی مد نظر بوده است. واحد خلاصه سازی، جمله در نظر گرفته شده است و تولید خلاصه های عمومی از مقالات علمی به زبان انگلیسی مورد بررسی قرار گرفته اند. روش های پیشنهادی نیز بر اساس همین پارامترها ایجاد شده اند.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

دانشگاه تربیت معلم - تهران - دانشکده فنی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023